本报北京2月12日电参与人类基因组计划的美、英、日、法、德、中六国科学家今天共同宣布,经过初步测定与分析,人类基因组约有32亿碱基,包含约3万到4万个蛋白编码基因。这是继去年6月26日人类基因组“工作框架图”公布后,科学家首次公布人类基因组第二阶段的“基本信息”。据悉,该计划第二阶段目标是在2001年绘制出人类基因组完成图。
在即将于近日发表在权威杂志《自然》上的科学论文《人类基因组的初步测定与分析》一文中,将报道六国人类基因组协作组联合取得的最新成果。
据悉,在人类基因组总共32亿碱基中,已经有10亿碱基测定的序列达到了完成图标准。科学家称,人类基因组是到目前为止测定的最大基因组,也是第一个精确测定的脊椎动物的基因组,尤为重要的,这是人类自身的基因组信息。科学家还发现,一些特征性序列在基因组中不同区域的分布有显著的差异,为研究功能提供了重要线索。
科学家公布的信息还包括:人类基因组中的3万到4万个蛋白编码基因,大约是线虫或果蝇基因数目的2倍;人类基因组编码的全部蛋白比无脊椎动物更复杂;人类蛋白质有61%与果蝇同源,43%与线虫同源,46%与酵母同源;人类17号染色体上的全部基因几乎都可以在小鼠11号染色体上找到;通过定位克隆的方法,科学家至少定位了30个疾病基因。
人类基因组计划下一步工作除了绘制完成图外,将进一步完善全部人类基因与蛋白质清单;测定其他基因组,包括小鼠、大鼠、斑马鱼等;分离全部人类单核苷酸多态性,以及对调控区域进行大规模深入研究与分析等。